ابهام زدایی واژگانی صفات مبهم در ترجمه ماشینی: بررسی پیکره بنیاد
Authors
abstract
موضوع ابهام در معانی واژه ها و ساختار ها و چگونگی برطرف کردن آن به ویژه به هنگام ترجمه ماشینی ذهن بسیاری از محققان را در این حوزه به خود مشغول داشته و برای آن راهکار های گوناگونی ارائه شده است. در این مقاله بر آنیم تا به ابهام موجود در واژه ها بپردازیم.صفات و نامهای مبهم با تعدد معانی خود دشواریهایی را در ترجمه ماشینی بوجود می آورند . در برنامه های خودکار که اراده انسانی در انتخاب معادل دخالتی ندارد این موضوع عیان تر است. ماشین نمی تواند بر اساس بافت به صورت خودکار بهترین معادل را انتخاب کند حال آنکه به کمک زبانشناسی رایانه ای و بکار گیری پیکره ها این امر ممکن است. در پژوهش حاضر به منظور اثبات این توانایی از میان دو مقوله اسم و صفت ، صفات را برای بررسی انتخاب کردیم. برای این کار کلیه ی صفات انگلیسی موجود در یک فرهنگ متوسط ( فرهنگ هزاره) را به همراه معانی متعدد آنها استخراج کرده و ضبط کردیم، آنگاه این صفات را در یک کشف اللغات موازی انگلیسی به فارسی قرار دادیم و جملاتی را که این صفات در آنها به کار رفته بودند ضبط کرده و این صفات را به همراه بافت و معنا استخراج کردیم و فهرستی به صورت یک کشف اللغات تهیه کردیم. برنامه ای برای این کشف اللغات نوشته شد به گونه ای که از میان معانی موجود بالاترین بسامد معنایی به همراه با هم آیی و بدون آن به عنوان معادل به هنگام ترجمه انتخاب شود. معادل های انتخاب شده رامترجمین انسانی نیز آزمودند و نتایج نشان دادند که در بیش از 50 درصد موارد معادل های انتخاب شده از سوی مترجمین با آنچه که برنامه ابهام زدایی انتخاب کرده بود یا یکسان و یا بسیار نزدیک بودند. نتایج حاصل از این پژوهش در امر ترجمه ماشینی، بازیابی اطلاعات دوزبانه، ایجاد شبکه های واژگانی و آموزش زبان فارسی سودمند خواهد بود.
similar resources
استخراج پیکره موازی از اسناد قابل مقایسه برای بهبود کیفیت ترجمه در سیستم های ترجمه ماشینی
امروزه با گسترش وسائل ارتباط عمومی و به خصوص شبکه جهانی اینترنت، نیاز به عملیات ترجمه خودکار به صورت چشم گیری افزایش یافته است. یکی از مطرح ترین روش های ترجمه ماشینی، روش آماری است. پارامترهای سیستم ترجمه ماشینی آماری با استفاده از مجموعه بزرگی از دادگان آموزشی (پیکره موازی دو زبانه) تخمین زده می شود؛ اما در برخی زبان ها هنوز مسئله نیاز پایه ای سیستم ترجمه ماشینی آماری یعنی پیکره های متنی بزرگ ...
full textابهام در ماشین ترجمه
هدف از انجام این تحقیق، بررسی گونههای مهم ابهام واژگانی و ساختاری و نیز مشکلاتی است که اینگونه ابهامها را در امر ترجمه ماشینی ایجاد مینمایند. برای انجام این کار پنج نوع مهم ابهام واژگانی با عناوین ابهامهای مقولهای، واژههای همآوا ـ همنویسه، واژههای همنویسه، چند معنایی و ابهام انتقالی، با ارائه مثالهایی از فارسی و انگلیسی مورد بررسی قرار گرفت. سپس ابهام ساختاری بررسی شد و دو نوع ...
full textنگرشی بر ترجمه ماشینی
از دیر باز بشر همیشه در آرزوی اختراع دستگاهی بوده است که بتواند متون را از زبان مبداء به زبان مقصد با سرعت و دقت فراوان ترجمه کند. تلاش برای رسیدن به این آرزو بیش از پنج دهه است که آغاز شده است و محققان دسا اوردهایی در زمینه طراحی سیستم ها و ساخت ماشین های مترجم بدست آورده اند ولی نام ماشینهای مترجم همواره مفهوم منفی را در ذهن افراد تداعی می کند و بیشتر مترجمان و محققان نظر منفی درباره ماشینهای...
full textنقش نشانه های نوایی در ابهام زدایی از عبارات مبهم فارسی
نقش نشانه های نوایی در ابهام زدایی از عبارات مبهم فارسی در دو آزمایش تولیدی و شنیداری جداگانه مورد بررسی قرار گرفت. دو نوع عبارت مبهم برای این منظور انتخاب شدند. نوع اول، زنجیره های آوایی سه هجایی بودند که بسته به محل حضور مرز واژگانی، به دو صورت یک واژه ای و دو واژه ای خوانده می شدند. نوع دوم گروه های اسمی دارای ابهام ساختاری شامل توالی یک اسم و دو صفت بودند که بسته به محل حضور مرز گروه نحوی م...
full textابهام شناسی در ترجمه قرآن
ابهام شناسی از جمله مباحث مهم زبان شناسی ترجمه است که از گذشته تا کنون، ابعادی از آن به تناسب و با عناوین مختلف در علوم گوناگون مورد توجه قرار گرفته و دانشمندان کم و بیش بدان پرداخته اند. اما در این تحقیقات، بررسی تطبیقی و توجه همزمان به مبدأ و مقصد و به ویژه محور قرار دادن قرآن و تنظیم مباحث به فراخور آن که در ترجمه قرآن نقشی مهم و درخور توجه دارد، جایگاه مناسبی نیافته است. البته تحقیقات یاد ...
full textرفع ابهام معنایی واژگان مبهم فارسی با مدل موضوعی LDA
Word sense disambiguation is the task of identifying the correct sense for the word in a given context among a finite set of possible sense. In this paper a model for farsi word sense disambiguation is presented. The model use two group of features: first, all word and stop words around target word and topic models as second features. We extract topics from a farsi corpus with Latent Dirichlet ...
full textMy Resources
Save resource for easier access later
Journal title:
پژوهشنامه پردازش و مدیریت اطلاعاتجلد ۳۰، شماره ۳، صفحات ۷۱۹-۷۳۵
Hosted on Doprax cloud platform doprax.com
copyright © 2015-2023